從第 1 天到第 30 天,從對 Agent 一知半解,到現在能做出會思考、還會調用各種工具的 Agent P,每一步都像在挑戰自己。
現在 Agent P 已經誕生了,是時候該好好回憶一下這段時間的「任務回憶錄」了( ̄▽ ̄)ブ
剛開始的時候,我對 Agent 的理解就是「一個會用工具的 AI」,但實際動手後才發現,光是理解 什麼是 Agent 就花了好多時間。
最大的收穫是搞清楚了 Agent 的核心概念:
那時候做的第一個簡單 Agent,現在看起來功能陽春得可笑,但那種「AI 真的照我的指令去做事」的成就感,到現在還記得很清楚。
有了基礎概念後,就開始琢磨怎麼把 Agent 包裝得更完整。FastAPI 和 Gradio 在這個階段扮演了關鍵角色。
FastAPI 讓我的 Agent 有了對外的接口,不再只是本地測試的玩具;Gradio 則給了它一張「臉」,讓人可以直接跟它對話。
這時候我才真正感受到,一個好的 Agent 不只要功能強,還要容易使用。
記得第一次看到 Gradio 介面跑起來,輸入問題後真的收到回應的那瞬間,心裡想的是:「哇,我真的做出一個助理了!」
最後這個階段是最精彩的,因為這時候開始接觸 MCP servers(Model Context Protocol servers)。
一開始聽到 MCP 時,老實說有點頭大。又是協議、又是 Server、又是 Client,感覺很複雜。但真正理解後才發現,MCP 根本就是 Agent 世界的「USB-C」—— 讓不同工具能用統一的方式接進來。
第一個整合的是 Spotify,讓 Agent P 能搜尋上面的音樂資訊等。看到它真的能搜尋歌曲時,感覺就像給 Agent P 裝上了「耳朵」。
接著是HackMD,當 Agent P 能夠查詢筆記等,它就不是單一無趣的,而是真正的工作夥伴了。
最後加上搜尋功能,Agent P 終於有了「觸角」,能夠主動獲取網路上的最新資訊。這時候它已經不只是我程式裡的 Agent,而是一個能連接外部世界的智慧體。
把這些 MCP Server 整合起來,其實比想像中困難:
技術挑戰:
架構挑戰:
每一個問題都是我困惱的地方,但解決的瞬間都超有成就感。特別是看到不同 Agent 能夠順暢協作去使用,且能夠完成任務時,真的有種「我終於成功了!」的感覺。
現在的 Agent P 已經能夠:
音樂相關:「幫我找XXX的OOO歌曲」
筆記相關:「幫我查看我有哪些筆記」
資訊搜集:「幫我查最新的 AI 發展趨勢」
天氣相關:「今天台灣台北天氣如何?」
打招呼:「你好阿~P!」
從單一功能到多元服務,從被動回應到主動協助,Agent P 已經不只是一個程式,而是一個有溫度的數位夥伴。
這 30 天最大的收穫,不是學會了某個技術,而是理解了 「整合」的力量。
單獨的 LLM 很聰明,單獨的 API 很有用,但當它們透過 Agent 架構結合起來時,1+1 真的大於 2。Agent P 能做的事情,已經遠遠超過我最初的想像。
另一個深刻體會是 「標準化」的重要性。MCP 協議讓不同工具能夠無縫接入,這種設計思維值得在其他專案中借鑑。
這 30 天,從零到有,從單純了解到實作,從單機版到網路服務,從單一功能到多元整合。
現在的 Agent P 還不算完美,但它已經是一個能夠實際工作的智慧助理了。更重要的是,透過這個過程,我對 AI Agent 的生態有了更深入的理解,也為未來更複雜的專案打下了基礎。
這個挑戰讓我深刻體會到,技術的魅力不只在於它本身有多先進,而在於如何用它來解決真實的問題,創造有意義的價值。
Agent P 或許只是開始,但它代表的是一種可能性 — 讓 AI 真正成為我們生活和工作的夥伴!
感謝這段旅程中的每一個挫折和驚喜,也感謝每一位跟著這系列文章一起學習的朋友。技術路上,我們都是探索者,讓我們繼續前行,創造更多可能!
下台一鞠躬ο(=•ω<=)ρ⌒☆